ارائه یک رتبه بند برای خطایاب معنایی با استفاده از ویژگی های حساس به متن
نویسندگان
چکیده
در عصر فناوری، روزانه حجم زیادی از سندهای الکترونیکی تولید میشود. از آنجا که این سندها توسط افراد مختلف تولید میشود دارای خطاهایی هستند. وجود خطاها باعث کاهش کیفیت سندها میشود، بنابراین وجود ابزارهای خطایاب باعث افزایش کیفیت میشود. یکی از انواع خطاها، خطای معنایی حساس به متن است. همانطور که از نام این آن برمیآید، برای تشخیص و تصحیح آن، نیاز به تحلیل اطلاعات موجود در متن است. در این مقاله، یک رتبهبند متمایزگر مستقل از زبان برای خطایابهای معنایی حساس به متن ارائه دادیم و از اطلاعات کل متن برای رتبهبندی استفاده کردیم. این رتبهبندی توسط ویژگیهای حساس به متن و یک مدل لگاریتم خطی انجام شده است. برای ارزیابی روش، از دو روش مبنای مختلف که یکی بر اساس مترجم ماشینی آماری و دیگری بر اساس مدل زبانی است استفاده کردهایم. به منظور ارزیابی سیستم از دو دادهی آزمون مختلف در زبان فارسی استفاده شده است. این روش باعث بهبود 17% در بازخوانی تشخیص و تصحیح نسبت به روش مبنای مترجم ماشینی آماری شده است.
منابع مشابه
ارائه یک رتبهبند برای خطایاب معنایی با استفاده از ویژگیهای حساس به متن
Nowadays, a large volume of documents is generated daily. These documents generated by different persons, thus, the documents contain spelling errors. These spelling errors cause quality of the documents are decrease. Therefore, existence of automatic writing assistance tools such as spell checker/corrector can help to improve their quality. Context-sensitive are misspelled words that have been...
متن کاملارائه رویکردی برای مدیریت و سازماندهی اسناد متنی با استفاده از تجزیهوتحلیل هوشمند متن
Regarding the fact that stored data occupies a large space in organizations and retention systems and information management that has been resulted in gigantic data warehouses, the need for extracting an appropriate model is felt increasingly. Text mining is one of the most significant methods for extracting a useful and appropriate model that helps organizations in achieving their goals throug...
متن کاملارائه یک الگوریتم بهبود یافته وب کاوی برای وب معنایی
این مقاله در حوزه داده کاوی و وب معنایی بوده و در آن روشی برای شخصی سازی صفحات وب براساس اصول داده کاوی و وب معنایی ارائه شده است. روش پیشنهادی، از لاگ مشاهده صفحات توسط کاربران به عنوان خوراک بخش داده کاوی، و از محتوای صفحات به عنوان ورودی واحد پردازش معنا استفاده می کند. نتایج حاصل از این دو فرآیند، با یکدیگر ترکیب شده و به عنوان صفحات پیشنهادی مدنظر کاربر، به او ارائه می شود. ایده استفاده از...
متن کاملبازسازی معنایی رساله برای دانشجویان دوره دکتری با نگاهی آسیبشناسانه و ارائه یک نظریه زمینهای
هدف پژوهش حاضر، بازسازی نهایی رساله برای دانشجویان دوره دکتری با نگاهی آسیبشناسانه و ارائه یک نظریه زمینهای است. پژوهش از نوع کیفی و از روش مردمنگاری استفاده شده است. جامعه آماری تحقیق شامل دانشجویان دوره دکتری دانشکده روانشناسی و علوم تربیتی دانشگاه علامه طباطبایی میباشد و نمونه آماری با استفاده از روش نمونهگیری هدفمند، (تعداد 15 دانشجوی دوره دکتری که در مراحل مختلف تدوین رساله دکتری بود...
متن کاملبخش بندی معنایی نظارتی ضعیف با استفاده همزمان از اطلاعات سطح شی و سطح متن
در این مقاله، روش جدیدی برای بخشبندی معنایی تصاویر در حضور دادههای آموزشی نظارتی ضعیف ارائه میگردد. هدف اصلی در بخشبندی معنایی اختصاص برچسب به تمامی پیکسلهای تصویر است. در دادههای آموزشی نظارتی ضعیف، تنها برچسبهای معنایی موجود در تصویر مشخص میگردد و مکان آنها در تصویر مشخص نمیگردد. نوآوری روش پیشنهادی، استفاده همزمان از اطلاعات سطح شی و سطح متن در تعیین برچسبهای معنایی در تصویر میبا...
متن کاملمنابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
عنوان ژورنال:
پردازش علائم و داده هاجلد ۱۲، شماره ۳، صفحات ۳-۱۴
میزبانی شده توسط پلتفرم ابری doprax.com
copyright © 2015-2023